Tecnologia Científica

Novo método de IA captura incerteza em imagens médicas
Ao fornecer mapas de rótulos plausíveis para uma imagem médica, o modelo de aprendizado de máquina Tyche poderia ajudar médicos e pesquisadores a capturar informações cruciais.
Por Adão Zewe - 14/04/2024


Pesquisadores do MIT e de outros lugares desenvolveram uma estrutura de aprendizado de máquina que pode gerar múltiplas respostas plausíveis quando solicitadas a identificar possíveis doenças em imagens médicas. Ao capturar a ambiguidade inerente a estas imagens, esta técnica poderia evitar que os médicos perdessem informações cruciais que poderiam informar diagnósticos. Créditos: Imagem: Notícias do MIT; iStock

Na biomedicina, a segmentação envolve a anotação de pixels de uma estrutura importante em uma imagem médica, como um órgão ou célula. Os modelos de inteligência artificial podem ajudar os médicos, destacando pixels que podem mostrar sinais de uma determinada doença ou anomalia.

No entanto, estes modelos normalmente fornecem apenas uma resposta, enquanto o problema da segmentação de imagens médicas está muitas vezes longe de ser preto e branco. Cinco anotadores humanos especialistas poderiam fornecer cinco segmentações diferentes, talvez discordando sobre a existência ou extensão das bordas de um nódulo em uma imagem de TC de pulmão.

“Ter opções pode ajudar na tomada de decisões. O simples facto de ver que há incerteza numa imagem médica pode influenciar as decisões de alguém, por isso é importante ter esta incerteza em consideração”, afirma Marianne Rakic, candidata a doutoramento em ciências da computação no MIT.

Rakic é o autor principal de um artigo com outros colegas do MIT, do Broad Institute do MIT e de Harvard e do Massachusetts General Hospital que apresenta uma nova ferramenta de IA que pode capturar a incerteza em uma imagem médica.

Conhecido como Tyche (em homenagem à divindade grega do acaso), o sistema fornece múltiplas segmentações plausíveis, cada uma destacando áreas ligeiramente diferentes de uma imagem médica. Um usuário pode especificar quantas opções Tyche produz e selecionar a mais adequada para sua finalidade.

É importante ressaltar que Tyche pode enfrentar novas tarefas de segmentação sem precisar ser treinado novamente. O treinamento é um processo que exige muitos dados, envolve mostrar muitos exemplos a um modelo e requer ampla experiência em aprendizado de máquina.

Como não precisa de reciclagem, o Tyche pode ser mais fácil de ser usado por médicos e pesquisadores biomédicos do que outros métodos. Ele poderia ser aplicado “pronto para uso” para uma variedade de tarefas, desde a identificação de lesões em uma radiografia pulmonar até a identificação de anomalias em uma ressonância magnética cerebral.

Em última análise, este sistema poderia melhorar os diagnósticos ou ajudar na investigação biomédica, chamando a atenção para informações potencialmente cruciais que outras ferramentas de IA podem perder.

“A ambiguidade tem sido pouco estudada. Se o seu modelo falhar completamente um nódulo que três especialistas dizem que existe e dois especialistas dizem que não, isso é provavelmente algo a que você deve prestar atenção”, acrescenta o autor sênior Adrian Dalca, professor assistente da Harvard Medical School e MGH, e pesquisador cientista do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL).

Seus coautores incluem Hallee Wong, estudante de pós-graduação em engenharia elétrica e ciência da computação; José Javier Gonzalez Ortiz PhD '23; Beth Cimini, diretora associada de análise de bioimagem do Broad Institute; e John Guttag, professor Dugald C. Jackson de Ciência da Computação e Engenharia Elétrica. Rakic ??apresentará Tyche na Conferência IEEE sobre Visão Computacional e Reconhecimento de Padrões, onde Tyche foi selecionado como destaque.

Lidando com a ambigüidade

Os sistemas de IA para segmentação de imagens médicas normalmente usam redes neurais . Vagamente baseadas no cérebro humano, as redes neurais são modelos de aprendizado de máquina que compreendem muitas camadas interconectadas de nós, ou neurônios, que processam dados.

Depois de conversar com colaboradores do Broad Institute e do MGH que utilizam esses sistemas, os pesquisadores perceberam que duas questões principais limitam sua eficácia. Os modelos não podem capturar a incerteza e devem ser retreinados, mesmo para uma tarefa de segmentação ligeiramente diferente.

Alguns métodos tentam superar uma armadilha, mas lidar com ambos os problemas com uma única solução tem se mostrado especialmente complicado, diz Rakic. 

“Se você quiser levar em conta a ambiguidade, muitas vezes terá que usar um modelo extremamente complicado. Com o método que propomos, nosso objetivo é torná-lo fácil de usar com um modelo relativamente pequeno para que possa fazer previsões rapidamente”, afirma.

Os pesquisadores construíram Tyche modificando uma arquitetura de rede neural simples.

Um usuário primeiro fornece a Tyche alguns exemplos que mostram a tarefa de segmentação. Por exemplo, os exemplos poderiam incluir várias imagens de lesões numa ressonância magnética cardíaca que foram segmentadas por diferentes especialistas humanos para que o modelo possa aprender a tarefa e ver se há ambiguidade.

Os pesquisadores descobriram que apenas 16 imagens de exemplo, chamadas de “conjunto de contexto”, são suficientes para que o modelo faça boas previsões, mas não há limite para o número de exemplos que podem ser usados. O conjunto de contexto permite que Tyche resolva novas tarefas sem retreinamento.

Para que Tyche capture a incerteza, os pesquisadores modificaram a rede neural para que ela produza múltiplas previsões com base em uma entrada de imagem médica e no conjunto de contexto. Eles ajustaram as camadas da rede para que, à medida que os dados se movem de camada para camada, as segmentações candidatas produzidas em cada etapa possam “conversar” entre si e com os exemplos no contexto definido.

Dessa forma, o modelo pode garantir que as segmentações dos candidatos sejam um pouco diferentes, mas ainda assim resolvam a tarefa.

“É como jogar dados. Se o seu modelo consegue rolar dois, três ou quatro, mas não sabe que você já tem dois e quatro, então qualquer um deles pode aparecer novamente”, diz ela.

Eles também modificaram o processo de treinamento para que seja recompensado maximizando a qualidade de sua melhor previsão.

Se o usuário solicitar cinco previsões, no final poderá ver todas as cinco segmentações de imagens médicas produzidas por Tyche, mesmo que uma seja melhor que as outras.

Os pesquisadores também desenvolveram uma versão do Tyche que pode ser usada com um modelo pré-treinado existente para segmentação de imagens médicas. Nesse caso, Tyche permite que o modelo produza vários candidatos, fazendo pequenas transformações nas imagens.

Previsões melhores e mais rápidas

Quando os investigadores testaram o Tyche com conjuntos de dados de imagens médicas anotadas, descobriram que as suas previsões capturavam a diversidade dos anotadores humanos e que as suas melhores previsões eram melhores do que quaisquer dos modelos de base. Tyche também teve um desempenho mais rápido do que a maioria dos modelos.

“Apresentar vários candidatos e garantir que sejam diferentes uns dos outros realmente oferece uma vantagem”, diz Rakic.

Os pesquisadores também descobriram que Tyche poderia superar modelos mais complexos que foram treinados usando um grande conjunto de dados especializado.

Para trabalhos futuros, eles planejam tentar usar um conjunto de contexto mais flexível, talvez incluindo texto ou vários tipos de imagens. Além disso, eles querem explorar métodos que possam melhorar as piores previsões de Tyche e aprimorar o sistema para que ele possa recomendar os melhores candidatos à segmentação.

Esta pesquisa é financiada, em parte, pelos Institutos Nacionais de Saúde, pelo Centro Eric e Wendy Schmidt do Broad Institute do MIT e Harvard, e pela Quanta Computer.

 

.
.

Leia mais a seguir